بين خصوصية الفرد وتقنيات المعلوماتية 
للكشف عن الإرهاب 


قاسم محمد دنش ' 


تثحسبٌ إشكالية خصوصية المواطن في لبنان وماهية المعلومات التي يمكن لأجهزة 
الأمن الإطلاع عليهاء من أكثر المواضيع سجالًا بين الساسة اليوم» خصوصًا مع ربط 
الأجهزة الأمنية بالفرق السياسية. هذه الإشكالية التى أودت إلى سجالات واسعة بين 
اللبنانيين بعد العام 2005 على خلفية كشف أو حجب 'داتا الإتصالات" لفرع 
المعطومات» دفعت البعض إلى التصريح العلني "انه اذا كان هناك خيار في كشف 
خصوصية المواطنين ومنع الجربمة» نحن حتمًا ننحاز الى منع حصول الجرائم ولو أدى 


الى كشف بعض خصوصيات المواطنين". 

بين هده الإشكالية وبين قدرات السلطات 
الأمنية والقضائية التي تستخدم وسائل باتت 
تقليدية» فلا بد من تطوير اليات التحقيقات 
القضائيةء» وكذلك الترتيبات الأمنية» بما 
يتناسب مع هذا الزمان الذي تعد فيه 
التكنولوجيا محورًا لا يتجزأًء إن بالأعمال 
الإرهابية والجرائم المنظمة» وإن باليات 
الكشف عن هذه الجرائم وتتبعهاء والكشف 
عنها قبل حصولها أيصًّا. فهل من الممكن 
الاستفادة من مزايا عصر ثورة المعلوماتية 
لتحقيق نتائج مرجوة من تحليل لمعلومات 
وييانات من داتا الإتصالات وغيرهاء مع 
تحقيق حماية وخصوصية المواطنين؟ 

إننا نتطلع من خلال هذه الدراسة» من 
تقديم دراسة حول إمكانية استخدام طرق 
تسمَّى بالتنقيب عن البيانات وجدواهاء مع 
الإشارة إلى أن محور البيانات المستخدمة 
هي بيانات وهمية تحاكي تلك الموجودة 
لون شركات مشظى الشبكات الخلودة 
ولدى الأمن العام اللبناني. 


الكلمات المفتاحية: تنقيب البيانات»› 
الكشف عن الإرهاب» خوارزميات التصنيف. 

1- المقدمة 

1.- مفهوم الإرهاب 
تشتق كلمة الإرهاب من رهب» رهبًا 
ورهبةء ووفق تعربفات المجمع اللغوى» فإنَ 
كلمة الإرهاب ككلمة حديثة في اللغة العربية 
أساسها "رهب" بمعنى خاف» لذلك فإِنَ 
تعبير الإرهابيين ما هو إلا وصف يطلق 
على الدين يسلكون سبل العنف لتحقيق 
أهدافهم الغقاندية أو السياسية . أو 
الايديولوجية. تعود الاعمال الإرهابية إلى 
قدیم الزمن لم يستحدث فى تاربخنا 
المعاصرء إلا أنه لأسباب ريما مرتبطة 
ببعض التعقيدات السياسية أو الدينية فقد 
أصبح مفهوم هذه العبارة غامصًا أحيائًا 
ومختلقًا عليه في أحيان أخرى. 

يعد الإرهاب وسيلة من وسائل الإكراه 
في المجتمع الدولي. تعريف القانون 
الجنائي للإرهاب تشير إلى تلك الأفعال 
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e‏ و رک وو کے 


العنيفة التي تخلق أجواء من الرعب» وعادة 
ا کن سا کت اچ صح ار کب اد 
هدف آيديولوجي معين» وفيه استهداف 
تة أو باشل سااية غير المدقين [1]. 

2.- خصوصية المواطن 

النسوسية هي :بق اللقراد أو 
المجموعات أو حتى المؤسسات الاعتبارية 
فى أن تقرر كيفية التعامل ونقل المعلومات 
الخاصة بها من حيث: متى» كيف» كميةء 
جهة» وشكل. وهذا يشمل خصوصية 
المعلومات: المكانيةء الشخصيةء 
والمعلومات. كذلك المعلومات التعريفية التي 
تشمل: الاسم الشخصي» رقم الهويةء 
الصورة الشخصية» رقم رخصة القيادةء 
عنوان البريد الالكتروني» العنوان 
الشخصى» رقم الهاتف النقال» رقم الهاتف»› 
قيمة الراتب»ء وغيرها من المعلومات التي 
تميز الأفراد والمؤسسات بعضهم عن 
بعض. إضافة إلى تلك المعلومات التي 
تتعلق بتنقلات الفرد داخل وخارج الوطن› 
ممتلكاته الشخصية» علاقاته الإجتماعية 
وغيرها من المعلومات. يعتبر الحق فى 
الخصوصية عميق الجذور وهى أحد 
الوق الأمامنة الت تضبت يه الكقب 
ا اکن اد ك 
عليه فی الوقت الحاضر فى ظل إفرازات 
وأثار توظيف تقنيات المعلوماتية الحديثة [2] 

3- من تحليل للبيانات إلى التنقيب 
فيها 

أدى الانتشار الواسع لتقنية المعلومات 
وسهولة إتاحتها إلى تضخم حجم المعلومات 
بصورة استباقية لم يشهدها التاريخ من قبلء 


ا ل من اقتا الساقات اة على 
الإنترنت وشركات الإتصالات مثلا متارًا 
للجدل» من حيث جدوی وجودها بهده 
الصورة المشرائية. وقنقما انتحدت عن 
البيانات الضخمة» فاننا نتحدث عن كميات 
لا يمكن تخيلها من البيانات متعددة الأنواع 
والمصادر بحجم يصل إلى المئات من 
التيرابايت أو حتى البيتابايت (البيتابايت هو 
الرقم واحد متبوعا ب15 صفرًا). 

من هنا ظهر ما یسمی باستخراج 
البيانات أو تنقيب البيانات Data Mining‏ 
كتقنية تهدف إلى استنتاج المعرفة من 
كميات هائلة من البيانات» تعتمد على 
الخوارزميات الرباضية والتي تعد أساس 
التنقيب عن البيانات وهي مستمدة من 
العديد من العلوم مثل علم الإحصاء 
والرباضيات والمنطق وعلم التعلم» والذدكاء 
الاصطناعي والنظم الخبيرة» وعلم التعرف 
إلى الأنماط وعلم الآلة. وغيرها من العلومء 
التي تعد من العلوم الذكية وغير التقليدية. 
ظهر التنقيب فى البيانات (و١اہا"‏ aا0a)‏ 
فى أوإخر الثمانينات وأثبت وجوده كأحد 
العول .التاجحة أتطيل كميات ضحبة من 
البيانات» وذلك بتحوبلها من مجرد معلومات 
متراكمة وغير مفهومة (بيانات) إلى 
معلومات قيّمة يمكن استغلالها والاستفادة 
منها بعد ذللك. برز انذاك كمجال حديثِ 
ذي قيمة بحثية في دراسة ما يُسمَى بالذكاء 
السطاسي. رقا الات بحل © 
والإحصائيات وعرض البيانات وغيرها [3]. 

يعد التنقيب عن البيانات عملية متطورة 
تقوم باستنتاج البيانات المطلوية من كم 
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كبير من البيانات طبقا لأهداف محددة 
مسبقًا [4]. 

تنقيب البيانات هو حقل متعدد 
التخصصات› يستفيد من المجالات بما فى 
فة لھ شت ب 
الاصطناعي» والتعلم الآلي» والشبكات 
ية والإنسا ات واكرف طب 
الأنماطء والنظم القائمة على المعرفةء 
واكتساب المعرفةء» واسترجاع المعلومات» 
والحوسبة عالية الأداء والصورة ومعالجة 
الإشارات» وتحليل البيانات المكانية والبيانات 
التصورıة Visualizati0¬)‏ 4 التي 
تعتمد بشكل كليّ على الإدراك البصري. 

وقد اجتذبت مرحلة التنقيب في البيانات 
اق من الاهشام في الأوساط البحشة 
على مدى العقد الماضي» في محاولة 
لتطوير خوارزميات قابلة للتوسع والتكيف 
مع كميات متزايدة من البيانات في البحث 
عن أنماط معرفية ذات معنى. وقد نمت 
حزم من الخوارزميات والبرمجيات ويشكل 
كبير خلال العقد الماضي» إلى حذ أن 
التوسع قد جعل من الصعب على العاملين 
في هذا الحقل تتبع التقنيات المتاحة لحل 

اكتشاف المعرفة فى قواعد البيانات 
Knowledge Discovery in Database )‏ 
07)) ليس بالعملية السهلة والتي قد يعتقد 
البعض أنها تتوقف عند تجميع البيانات 
وإدارتهاء بل نراها تمتد إلى التحليل والتوقع 
والتنبۇ بما سيحدث مستقبلا. 

التنقيب في البيانات يشكل جزءا من 


«knowledge discovery ةفرعnll اکتشاف‎ 


وهذه العملية هى الأكثر شمولا. تتضمن 
عملية اكتشاف المعرفة الخطوات التالية 

والتي تندرج ضمن الشكل 1 : 

أ) اكتشاف البيانات Daa‏ 
۷ وهي مرحلة جمع البيانات 
وتشمل كشف وتحديد وتوصیيف البيانات 
المتاحة. 

ب) تصفية البيانات وتنقيتها وم0 
14هعاع: ويتم فى هذه المرحلة إزالة 
البيانات المزعجة #ءأه التى لا أهمية 
لهاء كما يتم حذف البيانات المتضارية 
والبيانات غير المتناسقة. 

ت) تکامل البيانات Data‏ 
:integration‏ يتم في هده المرحلة تجميع 
البيائات السشابهة وتات الضلة ن 
مصادر البيانات المتعددة ودمجها معا. 

ث) اختيار llبيlنlت :Dataselection‏ 
في هذه المرحلة» يتم تحديد واسترجاع 
البيانات الملائمة من مجموعة البيانات. 

ج) تحوبل البيانات Data‏ 
:transformation‏ في هذه المرحلة يتم 
تحويل البيانات إلى نماذج مخصصة ملائمة 
لإجراءات البحث والاسترجاع بواسطة 
خلاصة الإنجاز أو عمليات التجميع. 

ح) التنقيب عن لاللبيانات وج0 
وiمiص:‏ أي استخدام طرق ذكية تطبق 
لاستخلاص أنماط البيانات» واستخراج 
نمادج مفيدة قدر الإمكان. 

خ( تقييم aillط :Pattern evaluation‏ 
يتم في هذه المرحلة تحديد الأنماط المهمة 
حفًا والتي تمثل قاعدة المعرفة لاستخداء 
بعض المقاييس المهمة. 
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ج کے ے 2 


Prepr cessed ا‎ 
Data 


nn 


Interpretation, 
.vahmation 


Patterns 


الشكل 1: مراحل اكتشاف المعرفة 


د) تمثیل المعرفة وتقديمها 
resentation Knowledge‏ م: وهي 
المرحلة الأخيرة من مراحل اكتشاف المعرفة 
فى قواعد البيانات وهي المرحلة التي يراها 
الساتقدء هذه المرحلة الأساسية تكد 
الأسلوب المرئى لمساعدة المستفيد في فهح 
وققمیں قاق استخراج البانات: 

إذًا التنقيب في البيانات هو خطوة 
أساسية لتطبيق أساليب ذكية بهدف الكشف 
عن أنماط البيانات المثيرة للاهتمام والمخبأة 
ف مجموعات البيانات الكبيرة. ومع ذلك» 
ْ بعض اتات دح ان مصطلح 
التنقيب عن البيانات "واا" taھل'‏ أصبح 
أكثر شعبية للإشارة إلى العملية التي يتم 
فيها . اكتشاف المعرفة knowledge‏ 
discovery‏ برمتها. 

وهناك جانب مهم جذا» يجب النظر إليه 
فى الاعتبار وهو أن هناك أنماطا جديدة قد 
تبرز» عادة ما تكون غير معروفة من قبل. 
ويالتالي يجب أن تكون أدوات التنقيب عن 


Domain 
Analysis 


Application 
Domain 


UOHEULO JSUT! ] 


Munirng 


Consolidation of Discovered Knowledge 


Transformed 
Data 


البيانات قادرة على البحث عن أنواع مختلفة 
من الأنماطء بأشكال متوازية لزبادة كفاءة 
التنقيب عن البيانات. كما يجب أيضا أن 
يته الكشف عن الأنماط في الأجزاء 
الصغيرة والفرعية» والتي تعرف بالحبيبات 
aritiesاgranu»‏ مما يعني البحث في 
مستوبات مختلفة من التجريد أو التفصيل. 
حلول التنقيب عن البيانات الجيدة هي التي 
تشير أيصًا إلى قدر من الثقة أو اليقين 
المرتبطة مع نمط اكتشافهاء لأن بعض 
الأنماط قد لا تصلح لكافة البيانات في 
مجموعة البيانات التي تم تحلیلها. 

2- الدراسات السابقة والمثيلة 

فى السياق القانوني» تعد أدواة تنقيب 
البيانات من أهم التقنيات المستخدمة في 
عمليات البحث أو التحليلات في قواعد 
البيانات من أجل اكتشاف أو تبۇ أو 
حالات شذوذ تدل على وقوع عمل إرهابي 
ا ااي محثفل. هذه الاداة اتن 
السلطات الأمنية القدرة على جمع 
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المعلومات في كثير من الأحيان من 
سار اة طن قك ارت آر 
شبكات الهاتف الخلوي أو الثابت لاستخراج 
بعض المعرفة التي من شأنها قد تكون 
مفيدة لهم. 

وتهدف تطبيقات استخراج البيانات ضد 
الإرهاب إلى جمع البيانات الشخصية 
الموجودة على شبكة الإنترنت أو الهاتف 
الخلوي أو الثابت» ومن ثم محاولة ريطها 
ببيانات أخرى من ملفات قضائية أو جرمية 
أو ما شابه. 

نستعرض فى ما يلى أعمالا مشابهة 
راسا هته من أجل إبراز خصوصية 
بحثنا فيما يتعلق بتطبيقه في المجال 
القضائي. 

1- تجميع عملاء شبكات الهاتف 
المحمول 

واحدة من هم تطبيقات تنقيب البيانات› 
هي تلك المطبقة من أجل خدمة تسوبقية 
اقضك لی بانات. شبكات الهاتف 
المحمول[5] » دفعت المنافسة بين مشغلى 
شبكات الهاتف الخلوي الشركات إلى استخدام 
أنظمة أوتوماتيكية لتحليل البيانات المسجلة 
لديهاء بإعتبار أن سلوك العملاء هو عامل 
يؤثر في تحسين استراتيجية الشركةء التي 
تعمل على تقسيم أو تجميع السلا شس 
فئات اجتماعية من ناحية أخرى. 

يعدد المؤلفون الكثير من أساليب 
کک ي ا ي 
الطريقة الأكثر استخدامًا «ك”ةم"->». 
ويشار إلى أن المؤلفين قد طبقوا طرائق 
تجميع البيانات دون أي تعديل للمتغيرات أو 


حتى تصفية البيانات. بينما في بحثناء لقد 
تغلبنا على أوجه القصور» وشرعنا في 
تجزتة البيائات وتدليها عن طريق الاعثاذ 
على تحليل الخبراء. 

2.- الكشف عن الأنشطة الإرهابية 
على شبكةه الإنترنت والهاتف الخلوي 
باستخدام تقنيات تنقيب البيانات 

بينت دراسة [6] بوضوح دور تنقيب 
البيانات في رصد الأنشطة الإلكترونية على 
شبكة الإنترنت من أجل الكشف عن 
الأعمال الإرهابية. ووفقًا لهؤلاء الباحشن» 
فإن الهدف الرئيس هو تحليل سلوك 
المستخدم النهائي على الشبكة العنكبوتية 
بما في ذلك تحليل لكافة الصور 
والفيديوهات المستخدمة والتواقيع الإلكترونية. 

وقد طبقت الدراسة [7] تقنيات التنقيب 
في البيانات على حالة واقعية لمكافحة 
الإرهاب. لذاء اتخذت شبكة الهاتف المحمول 
في نيجيريا كبيئة للبحث. وأوضحوا دور 
استخراج البيانات لمكافحة الإرهاب مباشرة 
أو في حالة المكالمات المسجلة. 

وبالإضافة إلى ذلك» حدد الباحثون دور 
تقنيات التصنيف والتجميع. كما أنهم 
أظهروا الدور المهم لتحليل الشبكات 
الاجتماعية في مكافحة الإرهاب» من خلال 
تقسيم بسيط للبيانات استنادا إلى شبكات 
الهواتف المحمولة والشبكات 6۶۴8S‏ 
باستخدام خوارزمية () .)"6۵٣5-‏ یشار 
إلى أن الباحثين في [7] لم يتعاملوا مع 
المسارات التالية: 

٠‏ مرحلة تدربب البيانات الوصفية. 

* متغيرات القرار . 
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ا 


* دور الخبراء القضائيين. 

تطبيق خوارزميات التصنيف والتجميع. 

في سياق مختلف بيئت دراسة [8] أن 
الحكومة لا يمكنها آن تستخدم تقنيات 
تنقيب البيانات كاداة كافية في مكافحة 
الإرهاب. 

تسلط هذه الدراسة الضوء على عيوب 
تنقيب البيانات التي تقوض خصوصية 
المواطنين» وتوضح دورها في عالم التعرف 
إلى الأنماطء في حين أن الشكل المدروس 
هو الصوت. وأوضح الباحثون أنه يتم 
تطبيق هذه التقنيات من قبل مكتب 
التحقيقات الفدرالي (مكتب التحقيقات 
الفدرالي) و8۸ (وكالة الامن القومي) 
للبحث عن مشتبه بهم عن طريق تحليل 
المكالمات الهاتفية بالبحث عن العبارات 
والكلمات محددة بين ترد بلیونات المكالمات 
الهاتفية. 

3- الكشف عن تبيض الأموال 
باستخدام تنقيب تنقيب البيانات 

وصف الباحثون في دراستهم [9]ء 
دور تنقيب البيانات في الكشف عن 
عمليات تبييض الأموال» من دون التطرق 
إلى شرح تقنيات تحليل المعاملات المالية 
والمصرفية. وبين الباحثون كيف أن طرائق 
"التعدين أو التنقيب المتكرر للتسلسل" إذا 
ما کانت قد تمثل عملیات تبییض الأموال 
ا 

وسمَّى الباحثون طرائق من تقفنيات 
تنقيب البيانات وكيفية استخدامها للهدف 
المنشود» وهذا ما هو مبين فى الجدول 
اتال : ٠‏ 


م 


قواعد الجمعيات 
(Association rules)‏ 
التنقيب في التسلسل 
المتكرر ) frequent‏ 
(sequence mining‏ 


الكشف عن العلاقة الخفية بين 
المعاملات المالية والمشاركين 


كشف أنماط المعاملات التى 
تحدث في كثير من الأحيان 


تساعد على تصنیف 
الحسابات إلى فئات محددة 
سلفا من المخاطر› تبعا 
لملامح المخاطر وأصحاب 
الحسابات 
تجميع المعاملات / الحسابات 
إلى مجموعات من المعاملات 
/ الحسابات المماثلة على 


Classification ) 
(algorithms 


Clustering )‏ خوارزميات التجميع في بناء 
(algorithms‏ التشكيلات الجانبية للتسلسل 


المشبوه للمعامالت ومنهم في 
العملاء / الحسابات. 
تتوقع إمكانية استخدام حساب 
كقناة لغسل الأموال على 
أساس المتغيرات الديموغرافية 
والسلوكية. 
يبرز اتصالات خفية بين 
حسابات مختلفة على أساس 
معایير مثل نشاط تحوبل 
الأموال والتفاعل مع نفس 
الحسابات أو ما شابه ذلك. 
عمليات تبيض الأموال حسب [9] 

4.- تحليل ملامح الجربمة باستخدام 
تقنيات تنقي 1 البيانات 

تطبيق تقنيات تنقيب البيانات من أجل 
تحلیل ملامح الجريمة هى سوي دراسة 
[10]. حیث شرع الباحثون في أهمية 
مراحل معالجة البيانات وتنظيفها» فضلا 
ر نتائج تحليلات البيانات التى يمكن 
تقبیه ها أتقبيد معرا فة ممكنة. لضمان الهدف 
المرجو من الدراسة» يوضح الباحثون كيفية 
استخراج البيانات لتحليل ملامح الجريمة 


Regression ) رlدڪiil'‎ 
(analysis 


Link mining and ) 
(analysis 
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من أجل تكد الإتجاهات السدة 
الجنائية. 

5ح المراقبة بالفيديو الذكى 

أبرز الباحثون[11] دور النظام الذكي 
في عمليات مراقبة الفيديو باعتماد ما سموه 
نظام الفيديو الذكي. يعتمد فيديو المراقبة 
الذلكي على أنظمة تلقائية مثل معالجة 
الإشارات والذكاء الاصطناعي واستخراج 
البيانات لتوسيع نطاق ميزات المراقبة 
بالفيديو والتطبيقات. إلى: 

1. توقع الحوادث عن طريق الكشف 
عن السلوك المشبوهة وإطلاق الإنذارات فى 
الوقت الحقيقى. 

2 ساعد عسات الحقى وتسا 
من خلال إجراء بحث في المحتوى› 
والمتابعة المكانية والزمانية. 

ويطبيعة الحال» فإن نظام المراقبة 
بالفيديو هذا غير متاح للعملية نظرا 
لتكلفة البنية التحتية (الكاميرا والشبكات 
والخوادم وما إلى ذلك) وتعقيد المعالجة 
المطلوبة. 

3- هدف الدراسة 

إننا نهدف من هذه الدراسة العلمية الى 
تقديمها بين يدي السلطات الأمنية 
والقضائية اللبنانية لبيان كيفية الإستفادة 
من الأنظمة والتقنيات الأوتوماتيكية 
لإستخلاض المعلومات وتحلدلها ذلاكت 
لتسهيل التحقيق والكشف عن مشبوهين 
في عمليات إرهابية في البلادء يكمن 
التحدي في هذه الدراسة الى الوصول الى 
أشخاص مشتبه بهم مع تقليل نسبة الوقوع 
في التشخيص الخطأً» مع الأخذ 


3 - الحداثة عد 


في الإعتبار خصوصية المواطنين 
واحترامها. 

4- المنهجية المتبعة ومصدر البيانات 

لأننا نعلم بأنّ الإشكالية المتناولة دقيقة 
جدّاء ولأ حجم البيانات كلما زادء زادت 
كمية المعرفة المتوقعةء ولان زيادة حجم 
البيانات بشكل عشوائي يؤدي أيصًا إلى 
التشخيص الخاطئ» عمدنا إلى انشاء 
استمارة استبيانيةء تقودنا الى استنتاج ماهية 
العوامل والمتغيرات المهمة التي تقود عادة 
المحققين الى 'طرف الخيط" في 

الاستمارة المذكورة ملأها مجموعة كبيرة 
من قضاة ومحامين ومحققين ومساعدين 
قضائيين وغيرهم من الأشخاص المعنيين 
في السلك الأمني والقضائي. 

القايل الإسساتي الإسقازات خلس 
إلى تسمية عدد من المتغيرات المساعدة 
في عملية استخلاص البيانات المخطط 
لها. 

نذكر من هذه المتغيرات: 

- عدد مرات الدخول والخروج من البلاد. 

- وجود سوابق جرمية لمستخدمي 
الخطوط الخلوبة. 

- الأماكن التي تم منها شراء الخط 
الخلوي . 

- حركة استخدام الخطوط الخلوبة بعد 
حصول الجريمة. ۰ 

- التاريخ الذي تم فيه شراء خطوط 
خلوية. 

- اقفال الخط الخلوي بعد تاربخ ارتكاب 
الجريمة. 
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- استخدام الخطوط الخلوية من قبل 
أشخاص وفدوا إلى لبنان قبل حصول 
الخوة 

اك ا واا ان مصدس البيانات 
حسب المتغيرات المذكورة هو : 

- الشركات المشغلة لشبكات 
الاتصالات الخلوية في لبنان. 

د الأمن العام اللبناني: 

إن الحصول على بيانات من المصادر 
المذكورة مهمة شبه مستحيلةء وإن كانت من 
أجل البحث العلمي. لذلكء عمدنا الى انتاج 
بيانات وهمية تحاكي واقع البيانات الحالي 
وذلك بعد حصول جريمة معينة» بهدف بناء 
الدراسة عليها. 

5- تحضير البيانات Data‏ 

:preparation 

تعد هذه المرحلة مرحلة تمهيدية لتحليل 
البيانات»› وتسمّى هذه المرحلة مرحلة 
المعالجة التمهيدي Pre-processing‏ gİÎو‏ 
مرحلة تنظيف البيانات .Data cleaning‏ 
تهدف هذه المرحلة الى تحضير البيانات 
امالك خصیصساً أا كرتا أن البباقات 
المخطط لدراستها تم انتاجها وهميًا وذلك 
لتعذر الحصول عليها. 

عدة طرق وتقنيات استخدمت في هده 
المرحلة: جدولة البيانات وازالة النواقص 
والاخطاء» وفحص جودتها ونزع غير 
الملائم منها أو تصحيحه. لذلك» قمنا 
بإعطاء قيم جديدة لكل متغير» فعلى سبيل 
المثال» تصنيف بيانات المتغير 'حركة 
استخدام الخطوط الخلوية بعد حصول 
الجريمة" إلى فئات ثلاث: 


الفئة الأولى: (القيمة =1): خارج البلاد. 

الفئة الثانية: (القيمة =2): منطقة تأوي 
ارهابیین - معرفة مسبقًا. 

الفئة الثالثة: (القيمة-3): منطقة داخل 
البلاد غير مشبوهة. 

Dataclustering تٽlنlıبئl تجمیع‎ -6 

تجميع البيانات هي عمليه وضع 
البيانات فى تجمعات متشابهة. تسعى هذه 
الطريقة الى تصنيف البياتات الى كتل 

تقسم خوارزمية التجميع مجموعة بيانات 
الى عدة تجمعات» حيث ان التشابه 
والتقارب بين نقطتين ضمن تجمع معين 
أكبر من تشابه بين نقطتين في تجمعين 
منفصلين. بالنسبة لنا في الدراسة هذه كل 
نقطة هى عبارة عن شخص ماء لدينا مسبقا 
اتات عد 

تعد خوlرajية K-means clustering‏ 
من أبرز الخوارزميات المستخدمة في 
تجميع البياناتء لذلك استخدمناها في هذا 
البحث مع تحديد (2=) عدد المجموعات 
التي نود أن نقسم البيانات اليها الى 

ويعد تطبيق هذه الخوارزمية» خلص 
اليتا مجموعتين من البيانات التي عرضناها 
على خبراء فى مجال. الثحقيق الأهثيء 
فأكدوا لنا أنه من الواضح جدًا أن التقسيم 
بدا بأن المجموعة الأولى التي تحوي حوالي 
7 من البيانات» تعد المجموعة التي 
تمثل بيانات الاشخاص غير المشبوهين في 
حين أن الأخرى تمثل الأشخاص 
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لذلك» أضفنا متغيرًّا جديدا يمثل إذا 
كانت البيانات مصنفة ضمن المجموعة 
الأولى أم المجموعة الثانية. 

7- خوارزميات التصنيف فة0 

classification 

فى المرحلة السابقة» أضفنا متغيرًا جديدًا 
ل م يسمىی ب "55ا٥"‏ لكل شخص»› 
وعليه يصنف ما اذا كان هذا الشخص 
مشبوهًا ام لا. 

هنا فى هذه المرحلة» نعف ما يسمّى 
باخوارزمیات التصنيف" آي الخوارزميات 
التي من شأنها أن تحدد الإنتماء للشخص 
لأي مجوعة من المجموعتين ينتمي. ومن 
أجل تحقيق الهدف المرجوء قمنا بتطبيق 
عدة خوارزميات على البيانات التي بين 
أيدينا . ۰ 

1- التصنيف وفق خوارزمية 
naive Bayesian‏ 

تعتمد خوارزمية ٣2۷٥ 82۷64١‏ على 
مبرهنة 83۷65 والتى تستند على الاحتمالات 
لمشروطة. فهي صيغة تحثسب احتمالية 
الإنتماء لكل صنف موجود. 

أخذت المبرهنة هذا الاسم نسبة 
إلى توماس بايز الذي توصل الى 
النتائج الأولية التى أستخدمت فيما بعد 
للحصول على المبرهنة بشكلها النهائي» فقد 


فل امف ۳ ۳ ایا انت 


دل لامر 4 ا لف ا فل رای ۳ 


استخرج الرباضی اللفرنسى لابلاس 
الفعاذلات الفبشة عل استاس 
الاحتمالات وهو الشكل النهائي الذى 
انتشرت فيه هذه المبرهنة بعد أن قام بايز 
بکتابتها بالتکاملات. 

المعادلة الرباضية التي ينبنى عليها هذا 
القعک ف فا شک کے سال 
الاحتمالات ا :(Bayes)‏ 

حيث أنه يمكن أن يكون: 

2 خصائص = خاصية 1 + خاصية‎ 
O E E 

وحساب احتمال الخصائص 'خ' علمًا 
الصنف "ص" هو كالتالى: 

اتفال الخصاتص اتشان 
الخاصية 1 × احتمال الخاصية 2 ×...× 
احتمال الخاضدة 

وحساب احتمال الخصائص "خ' علمًا 
الصنف 'ص" هو كالتالى: 

اتفال القضافسن “ج لعا الستف 
هن" = السففال الخاصدة 1 علطا السك 
عر اسان القاهة 2 علا الستف 
ماسقال الكاكة عا الس 
ص . 

يشار إلى أنه لتطبيق هذه الخوارزمية 
يفرض بالمتغيرات أن تكون مستقلة ولا يوجد 
ارتباط فيما بينها. 


~~ 
س ل 


iN # ۳‏ 
_ اش انصاص م _ 


a 


5 - الحداثة عدد 192/191 - ربيع 2018 


2- التصنيف 
Bayesian Network‏ 

تzعتnمد Bayesian Networks‏ على 
نموذج رياضي للاستدلال الاحتمالي»› وبتم 
الاستدلال الاحتمالي من خلال بعض 
المعلومات للحصول على احتمالات 
للمتغيرات الأخرى» وتعتمد شبكات النظرية 
الإفتراضية على اساس الاستدلال 
الاحتمالى لحل مشكلة عدم اليقين [12]: 
فهى مخططات موجهة غير حلفية مؤلفة 
من مجموعة عقد تمثل متغيرات مختلفة 
ومجموعة أقواس تمثل العلاقات الاعتمادية 
)غير اÛٹlêğwnة (dependence relation‏ 
بين هذه المتغيرات . 

إذا كان هناك قوس يتجه من العقدة ۸ 
إلى العقدة 8» عندئذ يمكن أن نقول أن 
العقدة ۸ هى والد أو أصل العقدة 8. إذا 
كانت للعقدة قيمة معروفة (ثابتة) عندئد 
تدعى )عقدةö‏ ıSİaد (node evidence‏ 
گن للف أن قش آي نى هن أنواع 
المتغيرات: قياسات» مؤشرات (معالم 
.hypothesis تlضرف gİ «(parameter‏ 

تدعی ایسا شبکات الاعتقاد 
lلبJjıl gİÎ Bayesian belief network‏ 
اختصارا شبكات الإعۃتتاد belief network‏ 
ولها تطبيقات عديدة في حقل المعلوماتية 
لبود ۰ 

تمثل الشبكات البايزية التوزيع 
الاقترانى للمتغيرات كافة الممثلة بعقد 
الشبكة. إذا افترضتا المتغيرات التالية: 
(”) × ,... ,(1)×ء وليكن مصطلح أصول 
(4) التعبير عن مجموعة العقد المتصلة 


وفق خوارزمية 


بالعقدة ۸ عندئذ يكون التوزيع الاقتراني 
للمتغيرات من (1)× إلى (”)× مثل جداء 
التوزبعات الاحتمالية: 


Pr(X(i) | parents(X()) 


من أجل: الذي يأخذ قيمًا من 1 إلى .١‏ 

إذا لم تكن للعقدة والد (أصل) عندئذ 
يكون توزعها الاحتمالي غير شرطي 
unconditional‏ ولا فإن توزعھا 
الاحتمالي يدعى شرطي (عندما يكون لها 
ا ` 1 

3- التصنيف وفق خوارزميات 17۷ا 

المتعلمون الكسولون ك6۲١3۲ها/4z‏ ا هم 
حالات من تخزين التدريب والقيام بأي عمل 
حقيقى حتى وقت التصنيف. التعلم الكسول 
هو أسلوب الذي يتأخر في تعميم البيانات 
الفرسة إلى أن زت الخدم إلى لاء 
حيث يحاول النظام تعميم بيانات التدريب 
قبل تلقی الاستفسارات. 

والميزة الرئيسة المكشسبة في توظيف 
طريقة التعلم الكسول هي أن وظيفة الهدف 
الذي سيتم تقرببه محليا مثل في خوارزمية 
85م-k.‏ ولان الدالة الهدف تقترب 
محلبًا لكل استعلام للنظام» فإن أنظمة 
التعلم الكسولة يمكن أن تحلَ في وقت واحد 
مشاكل متعددة وتتعامل بنجاح مع التغيرات 
في ساحة المشكلة [13]. 

من أهم مساوئ تعلم الكسول أنها تشمل 
متطلبات مساحة كبيرة لتخزين مجموعة 
كاملة من التدريب. وتزيد بيانات التدريب 
الصاخبة في معظم الأحيان من دعم الحالة 
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دون داع» لاأنه لا يوجد مفهوم أثناء مرحلة 
التدريب» وهناك عيب آخر هو أن أساليب 
التعلم كسول عادة ما تكون أبطأً للتقييء 
جلى الرغم من أن هذا يرتبط مع مرحلة 
التدريب اسرع. 

1..- التصنيف وفق خوارزمية )8| 

8۸ا هو المصنف ك”2عمص-k‏ الذي 
يستخدم مقياس المسافة نفسها. يمكن تحديد 
دد آقرب الجيران بشكل صربح في محرر 
الكائن او تحديده تلقائيًا باستخدام التركيز 
البيني للمصادقة عبر الإجازة إلى حد أعلى 
تعطى القيمة المحددة. إيبك هو مصنف 
قريب الجوار ۸. وهناك نوع من خوارزميات 
البحث المختلفة يمكن استخدامها لتسريع 
مهمة العثور على أقرب الجيران. 

اة المسافة الستككمة هي معلمة 
لطريقة البحث» الشيء المتبقي هو تفسه ل 
إبل- وهذا هو» المسافة الإقليدية. وتشمل 
الخيارات الأخرى بحسب [14] أنه يمكن 
ترجيح التوقعات من أكثر من جار واحد 
وفقا لمسافاتها عن مثيل الاختبار» وبتم 
تنفيذ صيغتين مختلفتين لتحويل المسافة إلى 
وزن [13]. 

یمکن تقیید عدد حالات التدريب انی 
يحتفظ بها المصنف عن طريق تحديد خيار 
حجم النافذة. كما يتم إضافة حالات التدريب 
کی اکسا فس اا لے ا 
من حالات التدريب في هذا الحجم. 
Kstar‏ 

يمكن تعريف خوارزمية كستار على أنها 

يقة لتحليل المجموعات التي تهدف 


أساسا إلى تقسيم الملاحظة ١"‏ إلى 
مجموعات K‏ حيث تنتمي كل ملاحظة إلى 
المجموعة بأقرب متوسط. يمكننا أن نصف 
خوارزمية ۸* كمتعلم القائم على المثال 
الذي يستخدم الإنتروبيا كمقياس المسافة. 
من فوائده آنه يوفر نهجًا متسمًا للتعامل مع 
الصفات القيمة الحقيقية» والسمات الرمزية 
والقيم الناقصة [15]. ومن هنا يمكن ان 
نعرف *K‏ هو بسيطء مثبت القائم على 
المثال» على غرار ×- أقرب الجار (۸×- 
ن). يتم تعیین منيلات بيانات جديدة» ×» 
إلى الفصل الذي يحدث بشكل متكرر بين 
نقاط البیانات الاقرب إلى .k‏ ثم يت 
استخدام المسافة إنتروبيك لاسترداد الحالات 
الأكثر مماظة من مجموعة البيائات. من 
خلال المسافة الإنتروبية كمقياس له عدد 
من الفوائد بما في ذلك التعامل مع الصفات 
القيمة الحقيقية والقيم المفقودة. 

4- خورزميات التصنيف وفق 
|g‏ عد (Rule classifier algorithms)‏ 
One R‏ 

تعد خوارزمية ۸ 006 واحدة من 
أبسط خوارزميات التصنيف. كما هو 
موضح في [16]ء تنتج قواعد بسيطة 
تستند إلى سمة واحدة فقط. فإنه يولد شجرة 
القرار على مستوى واحد» والتي يتم التعبير 
عنها بمجموعة من القواعد لكل اختبار سمة 
معينة وأحدة. 

إنها طريقة بسيطة غالبا ما تأتي مع 
قواعد جيدة جدا لتوصيف الهيكل في 
البيانات [17]. غالبا ما يحصل على دقة 
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معقولة على العديد من المهام ببساطة عن 
طرق النظر في سمة وأحدة. 
لکل سمة: ۸ 
لكل قيمة ۷ من تلك السمةء قم بإنشاء 
قا عدة: 
1- عد عدد المرات التي تظهر فيها كل 
2- العثور على التصنيف كءهاء الأكثر 
شيوعاء ٥‏ 
3- جعل قاعدۃ 'إذا ۷ = ۸ ثم '€C = ٥‏ 
احسب معدل الخطاً لهذه القاعدة واختر 
السمة التي تنتج قواعدها أدنى معدل خطاً. 
Zero R‏ 
هى الطريقة الأبسط لاتصنيف وتعتمد 
على الهدف مع تجاهل كل التوقعات 
الأكثرية. هي طريقة مفيدة لتحديد نقطة 
مقارة المخاف :طرق . اسف ضحد 
الخوارزمية على إنشاء جدول تردد للهدف 
وتحديد القيمة الأكثر شيوعًا. التنبؤات 
المساهمة: لا يوجد شيء یمگق أن بقال 
عن مساهمة التنبؤ إلى نموذج لأن زيرور 
لا تستخدم أي منها. تقييم نموذج: زيرور 
يتنباً فقط فئة الأغلبية بشكل صحيح. وكما 
ذكر من قبل» فإن زيرور مفيد فقط لتحديد 
أداع كط الأسائن طرق التسحص الأخرف 
[18]. 
(Locally weighted learning) LWL‏ 
تعتمد خوارزمية ا1۷۷ إلى تسنيد اوزان 
متروسة لكل مال أو حالة وفق ما تسى 


«weighted instances handler» 
ثم بعد ذلك يتم تفعيل التصنيفات‎ .]19[ 
gl Bayesian Networks olڌختulڊ‎ 
الإنحدارت اوم۲ وم۸ على سبيل المثال.‎ 
Ridor 

تقوم خوارزمية ١40أ‏ بإنشاء قاعدة 
افتراضية أواء ثم الاستثناءات للقاعدة 
الافتراضية مع معدل الخطأً (المرجح) 
الأقل. ثم يولد 'أفضل" استثناءات لكل 
استثناء» وبكرر حتى تقليص معدل الخطأ. 
ويالتالي فإنه يؤدي توسع تشبه شجرة من 
الاستثتاءات. استثناءات هي مجموعة من 
القواعد التى تتنباً التصنيفات الأخرى 
85 بخلاف الافتراضي أو ما يسمى 
بال ااهامل [20]. تعتبر هذه الخوارزمية 
كنهج تدريجي في اكتساب المعرفة. 

8- النتائج 

الإختبار كان بأخذ البيانات السابقةء 
وأبقينا منها %66 منها كما هي» وذلك من 
أجل أن تكون قاعدة انطلاق وقياس لهذه 
الخوارزميات» في حين أن البيانات المتبقية 
استخدمت لإختبار الخوارزميات المذكورة 
من أجل اعادة تصنيفها ومقارنتها بالأصل 
إذا ما كان التصنيف صحيكًا أم لا. وقد 
حصلنا على أداء الخوارزميات حسب 
الجدول 2» وببين الشكل 2 الوقت 
المستغرق لكل خوارزمية. يبدو واضحا أنَ 
أداء ا۷ا وO"6۴‏ هما الأفضل من حيث 
دقة التصنيف (100%) ويظهر جليًا أن 
۷ا هو الأفضل من بين الخوارزميات 
من حيث الوقت المستغرق للتصنيف. 
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لقد بيا فى هذه الدراسة أننا يمكننا أن 
نصل إلى دقة في تحديد إرهابيين محتملين 
اسل إلى 6100 وکا سى آله ذا 
أقطت الدراسة نتاقج حول إرهابيين 
محتملين فإحتمال الخطأً بأن يكونوا ليسوا 
كذلك هو %0. إننا نتطلع لتنفيذ هذه 
الدراسة على بيانات حقيقيةء نقدم من 
خلالها دراسة المعنيين بجريمة ما لتقديمها 
بين يدي السلطات. 


الخاطئ 


لضائب 


١ 
90.7563 9.2437 


0.4202 


naive 
Bayesian 


Bayesian 


99.5798 Ei 


جدول1 : جودة النتائج لكل خوارزمية. 


الوقت المستغرق لكل خوارزمية 
I‏ 
0.08 
0.06 
0.04 
0.02 
0 
F3 £ £‏ $ £ 5 46 
٭ 5 7 d23 ¥ f‏ 
0U‏ 5 
0 
a‏ 0 
ر 
َة 
(ثانية) 


الشكل 1: الوقت المستغرق لكل خوارزمية. 


9- الخلاصة والتوصيات 

إننا من خلال هذه الدراسةء نحاول أن 
نقدم إلى الأجهزة الأمنية والقضائية شينًا 
بسيطا مما يمكننا فعله من أجل محارية 
الإرهاب واجتثاث العقول المدبرة. ان هذا 
الطرح الذي حلص إلى إمكانية تصنيف 
الأشخاص كضالعين في جريمة إرهابيةء 
محددة مسبقًاء ب 0 خطاً ولو علی بیانات 
وهمية» يمكن استخدامه على بيانات واقعية 
مصدرها الشركات المشغلة للهاتف الخلوي 
في لبنان والأمن العام اللبناني. 


*# % *#* 
الهوامش 


دكتور ومهندس - أستاذ متفرغ في كلية الاقتصاد 
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البربد الإلكتروني: Kassem.danach@iul.edu.|b‏ 
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